Hive, Hadoop এর উপরে তৈরি একটি ডেটাবেস সিস্টেম, যা SQL-অনুরূপ কুয়েরি ভাষা (HiveQL) ব্যবহার করে ডেটা প্রক্রিয়া করে। Hive বিভিন্ন ধরনের ডেটা টাইপ সমর্থন করে, যার মধ্যে STRING, INT, BOOLEAN, এবং FLOAT অন্যতম। এগুলির প্রতিটি ডেটা টাইপের উদ্দেশ্য এবং ব্যবহার বিভিন্ন ধরনের ডেটা সংরক্ষণ ও বিশ্লেষণ করতে সাহায্য করে।
STRING
STRING ডেটা টাইপ ব্যবহার করা হয় যে কোনো ধরনের টেক্সট (অক্ষর বা ক্যারেক্টার) সংরক্ষণ করতে। Hive-এ STRING ডেটা টাইপ ব্যবহার করা হয় যখন কোনো ডেটার আকার অপরিবর্তনীয় না হয়ে একাধিক অক্ষর বা চরিত্র হতে পারে।
STRING এর ব্যবহার:
CREATE TABLE employees (
id INT,
name STRING,
department STRING
);
এখানে name এবং department কলামগুলো STRING টাইপ, কারণ এই কলামগুলোতে টেক্সট ডেটা থাকবে।
STRING ইনসার্ট করা:
INSERT INTO TABLE employees
VALUES (1, 'John Doe', 'Sales');
এখানে John Doe এবং Sales STRING টাইপের ডেটা।
INT
INT (Integer) ডেটা টাইপ ব্যবহার করা হয় পূর্ণসংখ্যা (whole numbers) সংরক্ষণ করার জন্য। Hive-এ INT ডেটা টাইপ ব্যবহার করে এমন সব ডেটা সংরক্ষণ করা যায়, যেগুলি কোনো দশমিকের প্রয়োজন নেই।
INT এর ব্যবহার:
CREATE TABLE employees (
id INT,
age INT
);
এখানে id এবং age কলামগুলো INT টাইপ, কারণ এগুলোতে পূর্ণসংখ্যা ডেটা থাকবে।
INT ইনসার্ট করা:
INSERT INTO TABLE employees
VALUES (1, 30);
এখানে 1 এবং 30 INT টাইপের ডেটা।
BOOLEAN
BOOLEAN ডেটা টাইপ ব্যবহার করা হয় সত্য (true) বা মিথ্যা (false) মান সংরক্ষণ করার জন্য। এটি সাধারণত শর্তাধীন কুয়েরি এবং ফিল্টারিংয়ে ব্যবহৃত হয়।
BOOLEAN এর ব্যবহার:
CREATE TABLE employees (
id INT,
name STRING,
is_active BOOLEAN
);
এখানে is_active একটি BOOLEAN টাইপ, যেটিতে true বা false মান থাকবে।
BOOLEAN ইনসার্ট করা:
INSERT INTO TABLE employees
VALUES (1, 'John Doe', true);
এখানে true BOOLEAN টাইপের মান।
FLOAT
FLOAT ডেটা টাইপ ব্যবহার করা হয় দশমিক সংখ্যা (decimal numbers) সংরক্ষণ করার জন্য। এটি সাধারণত যখন ডেটার মান দশমিক সঠিকতা প্রয়োজন হয়, তখন ব্যবহার করা হয়। FLOAT টাইপ ব্যবহার করে আমরা ডেটার একটি নির্দিষ্ট সঠিকতা (precision) সংরক্ষণ করতে পারি।
FLOAT এর ব্যবহার:
CREATE TABLE employees (
id INT,
name STRING,
salary FLOAT
);
এখানে salary কলামটি FLOAT টাইপ, কারণ এখানে বেতন একটি দশমিক মান হতে পারে।
FLOAT ইনসার্ট করা:
INSERT INTO TABLE employees
VALUES (1, 'John Doe', 50000.75);
এখানে 50000.75 FLOAT টাইপের ডেটা, যেখানে একটি দশমিক মান রয়েছে।
ডেটা টাইপ নির্বাচন
যখন Hive-এ টেবিল তৈরি করা হয়, তখন সঠিক ডেটা টাইপ নির্বাচন করা খুবই গুরুত্বপূর্ণ, কারণ এটি ডেটার সঠিকতা, পারফরম্যান্স এবং স্টোরেজের সাথে সম্পর্কিত। উদাহরণস্বরূপ:
- যদি কোনো কলামে শুধুমাত্র পূর্ণসংখ্যা ডেটা থাকতে পারে, তাহলে INT টাইপ ব্যবহার করা হবে।
- যদি কোন কলামে টেক্সট ডেটা থাকতে পারে, তবে STRING টাইপ ব্যবহার করা হবে।
- BOOLEAN ব্যবহার করা হবে যদি আপনি শুধুমাত্র দুটি মান (সত্য/মিথ্যা) সংরক্ষণ করতে চান।
- FLOAT টাইপ ব্যবহার করা হবে যদি ডেটা দশমিক সঠিকতার প্রয়োজন হয়, যেমন বেতন বা অন্যান্য পরিমাণ।
উপসংহার
Hive-এ STRING, INT, BOOLEAN, এবং FLOAT বিভিন্ন ডেটা টাইপের মধ্যে প্রতিটি টাইপের নির্দিষ্ট ব্যবহার রয়েছে। এই ডেটা টাইপগুলি যথাযথভাবে ব্যবহার করে আপনি Hive-এ সঠিকভাবে ডেটা সংরক্ষণ এবং বিশ্লেষণ করতে পারবেন। Hive-এর এই বৈশিষ্ট্যগুলি Hadoop প্ল্যাটফর্মের বিশাল ডেটাসেট প্রক্রিয়া করার জন্য গুরুত্বপূর্ণ এবং কার্যকরী।
Read more